Wang Haihua
🍈 🍉🍊 🍋 🍌
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等
假设检验的基本思想是小概率事件原理,其统计推断方法是带有某种概率性质的反证法。
小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设$H_0$是否正确,首先假定该假设$H_0$正确,然后根据样本对假设$H_0$做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设$H_0$,否则应接受假设$H_0$
假设检验过程基于H0为真的初始假设进行的
假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平。
对于不同的问题,检验的显著性水平$\alpha$不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件".
根据样本观测结果计算得到且据以对原假设和备择假设做出决策的某个样本统计量,称为检验统计量。
检验统计量是用于假设检验计算的统计量,实际上是对总体参数的点估计量,但点估计量不能直接作为检验的统计量,只有将其标准化后,才能用于度量它与原假设的参数值之问的差异程度。而对点估计量的标准化依据原则是:
通常将标准化统计量简称为检验统计量,标准化的统计量可表示为: $$标准化统计量=\frac{点估计量-假设值}/{点估计量的抽样标准差}$$
拒绝域亦称否定域,又称临界域,指在假设检验中根据检验统计量的分布,由给定的小概率$\alpha(0<\alpha<1)$作为显著性水平所确定的拒绝原假设$H_0$的区间,即统计量在其中取值的概率为$\alpha$的区域。
与拒绝域对应的是接受域。能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域;不能够拒绝原假设的检验统计量的所有可能取值的集合称为接受域;根据给定的显著性水平确定的拒绝域的边界值,称为临界值。
拒绝域的大小与人们事先选定的显著性水平有一定关系。在确定了显著性水平之后,就可以根据值的大小确定出拒绝域的具体边界值。
在给定显著性水平后,查统计表就可以得到具体的临界值。将检验统计量的值与临界值进行比较,就可做出拒绝或不拒绝原假设的决策。
当样本量固定时,拒绝域的面积随着$\alpha$的减小而减小。$\alpha$值越小,为拒绝原假设所需要的检验统计量的临界值与原假设的参数值就越远。
拒绝域的位置取决于检验是单侧检验还是双侧检验。
左上图为左侧检验,右上图为右侧检验,第二行图为双侧检验。
1、提出原假设(null hypothesis),符号是$H_0$;备择假设(alternative hypothesis)的符号是H1(或Ha) 。
2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。
在假设检验中,第一类错误是当原假设为真时拒绝了原假设。第二类错误是当原假设为假时,接受了原假设。
本文简单介绍了假设检验的基本概念、思想和过程,在这个框架下我们进一步可以进行特定类型问题的检验,如大样本均值检验等。